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科 交 又 研究 的 重要 前 提 ,， 从 海量 的 文献 中 快速 、 精 准 地 发 


现 领 域 相关 交叉 文献 有 助 于 研究 人 员 快 速 地 把 握 领 域 学 科 交 叉 动 态 ,识别 领域 学 科 交 叉 研 究 热 点 与 前 没 。 提 
出 基于 Rao-Stirling 指数 的 领域 学 科 交 又 文献 发 现 方 法 ,并 以 纳米 科学 与 纳米 技术 领域 为 例 , 探 讨 该 方法 的 可 行 
性 。[ 方 法 /过 程 ] 在 Web of Science 数据 库 下 载 纳 米 科学 与 纳米 技术 领域 文献 ,构建 期 刊 缩写 -全称 -学科 类 
别 对 照 表 , 利 用 Python 编程 构建 文献 参考 文献 学 科 分 布 矩 阵 ,利用 R 编程 计算 每 篇 文献 的 Rao -Stirling 指数 进 
行文 献 的 FIFA LMA ,根据 测度 结果 将 纳米 科学 与 纳米 技术 领域 文献 按照 学 科 交 叉 程 度 分 为 三 个 水 平 ,以 发 
IRF AL [ARAW] 基于 Rao-Stirling 指数 的 领域 学 科 交 又 文献 发 现 方法 可 以 实现 领域 文献 水 
只 学科 交叉 测度 ,并 发 现 学 科 交 叉 文 献 , 且 该 研究 方法 也 同样 可 扩展 到 其 他 研究 领域 
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随 着 科学 研究 的 不 断 深入 ,学 科 不 断 分 化 ,学 科 逐 
渐 噩 分 为 许多 子 学 科 , 向 着 更 加 专业 化 的 方向 发 展 。 
然而 在 继续 分 化 的 同时 ,学 科 又 逐步 走向 交叉 综合 ,向 
着 留 度 综合 化 ,整体 化 ,交叉 化 的 方向 发 展 。 吸 收 不 同 
学 释 领 域 的 知识 被 认为 是 科学 发 展 的 关键 因素 。 面 对 
重 深 社会 问题 和 复杂 的 科学 问题 ,往往 需要 借助 几 个 
学 科 之 间 的 交叉 ,渗透 .融合 来 共同 解决 。 

学 科 交 叉 人 研究 (interdisciplinary research , IDR ) , 又 
称 为 跨 学 科研 究 或 者 交叉 科研 , 即 通 过 学 科 间 知识 的 
整合 而 进行 的 研究 。 学 科 交 叉 研 究 通常 意味 着 创新 
和 进步 ,学 科 交 叉 点 往往 是 科学 新 的 研究 热点 和 前 沿 。 
物理 学 家 海 森 伯 说 道 :“ 最 突出 的 科学 发 现 往往 发 生 于 
两 条 不 同 的 思维 路 线 的 交叉 点 上 ”2 。 学 科 交叉 研究 
可 以 解决 各 传统 学 科 所 不 能 触及 的 未 知 领域 的 研究 问 
题 ,在 传统 学 科 已 经 发 展 成 熟 的 情况 下 ,这些 未 知 领域 
往往 是 重要 学 术 突 破 的 产生 之 处 。 学 科 交叉 研究 是 完 
成 复杂 高 难 科研 问题 的 有 效 选择 ,DNA 双 螺 旋 结构 、 


基因 重组 技术 、 核 磁 共 振 成 像 等 许多 重要 的 科学 发 现 
都 是 因为 打破 了 学 科 界 限 而 获得 。 科 学 最 高 奖 诺 贝尔 
奖 1900 -2011 年 颁发 的 365 项 自然 科学 奖项 中 ,有 
198 项 为 学 科 交 义 领 域 ,所 占 比 例 高 达 54.2% ,并 且 呈 
稳步 上 升 趋势 ” 。 每 年 《科学 》( Science ) 杂志 评 出 的 
“十 大 科学 突破 ”中 绝 大 多 数 也 为 学 科 交 又 研究 的 成 
Ao 

随 着 学 科 交 又 研究 在 科技 进步 中 扮演 越 来 越 重 要 
的 角色 ,从 不 同 的 角度 来 研究 学 科 交叉 是 非常 必要 的 。 
对 某 领 域 相关 的 学 科 交 叉 点 进行 识别 ,揭示 学 科 交 又 
关系 和 特点 ,把握 学 科 交 叉 研 究 的 热点 方向 和 趋势 ,已 
成 为 学 科 交 又 研究 的 重要 分 支 , 可 以 为 相关 研究 者 提 
供 理论 思路 和 假设 ,帮助 其 选择 正确 的 研究 方向 。 并 
对 高 校 的 学 科 设 置 与 调整 和 学 科 交 叉 研 究 中 心 的 设立 
提供 支持 ,为 科学 管理 者 项 目 评审 政府 机 构 支 持 政策 
的 制定 提供 借鉴 。 


2 国内 外 相关 研究 现状 


对 学 科 交 叉 进 行 的 研究 主要 包括 理论 研究 和 实证 
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图 二 情报 三 作 
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ChinaXiv 合 作 期 刊 


研究 两 部 分 。 理 论 研究 主要 为 探讨 学 科 交 又 起 源 、 演 
化 .形成 以 及 发 展 机 制 等 ,实证 研究 则 主要 基于 文献 计 
量 或 文本 挖掘 的 方法 发 现 某 一 期 刊 .机 构 或 者 学 科 的 
学 科 交 叉 情 况 ,本文 主 要 探讨 实证 研究 部 分 。 按 照 研 
究 对 象 的 不 同 ,可 以 将 学 科 交 叉 的 文献 发 现 研究 分 为 
四 类 ,分 别 是 基于 关键 词 . 基 于 文献 自身 、 基 于 作者 以 
及 基于 引文 的 学 科 交 叉 研 究 。 

基于 关键 词 的 学 科 交 叉 研 究 将 论文 关键 词 作为 共 
现 单元 ,对 关键 词 间 的 共 现 频次 进行 统计 , 共 现 频次 越 
高 代表 关键 词 所 属 的 学 科 领 域 间 关 联 强度 越 高 ,领域 
间 学 科 交 又 性 越 强 。 如 A. Rip 等 四 以 十 年 内 生物 技术 
领域 核心 期 刊 刊载 的 文献 为 研究 对 象 ,通过 共 词 分 析 
研究 领域 的 动态 变化 ,探索 不 同 研究 领域 间 联系 随时 
间 的 变化 。 魏 建 香 局 利用 CNKI 数据 库 中 近 十 年 情报 
学 和 计算 机 科学 两 个 领域 核心 期 刊 中 的 文献 题 录 信息 
进行 挖掘 ,借助 模糊 C - 均值 聚 类 (FCM) 算法 发 现 两 
领 梧 内 的 学 科 交 叉 文献 ,并 利用 基于 免疫 选择 的 粒子 
群 兢 化 (IS-PS0) 算 法 与 FCM 的 聚 类 融合 算法 对 学 科 
交 鸿 文献 进行 知识 发 现 和 可 视 化 展示 。 李 长 玲 等 "其 
司 序列 分 析 的 方法 ,通过 对 时 序 高 频 词 聚 类 ,动态 
展示 情报 学 和 计算 机 学 两 个 学 科 交 叉 研 究 主题 随时 
间 玖 变化 。 基 于 关键 词 的 学 科 交 叉 研 究 通常 使 用 文本 


献 , 往 往 不 能 进行 准确 的 划分 ,导致 分 析 结果 不 准确 。 
基于 作者 的 学 科 交 叉 研 究 即 通过 作者 跨 学 科 发 文 
数 或 者 文献 内 合作 者 所 属 不 同学 科 数 来 评估 学 者 、 文 
献 . 期 刊 以 及 领域 的 学 科 交 又 研究 情况 。J.，Qin 等 " 
通过 作者 、 作 者 机 构 以 及 所 属 学 科 的 数量 以 及 合作 的 
类 型 对 研究 合作 进行 分 析 ,探讨 不 同 水 平和 学 科 的 作 
者 合作 研究 的 学 科 交 叉 程 度 的 差异 性 。J. Schum- 
mer "| 通过 合 著者 所 属 机 构 院 系 来 确定 研究 者 所 属 学 
科 , 并 筛选 合 著 者 所 属 不 同学 科 的 文献 作为 学 科 有 交叉 
文献 ,研究 探讨 纳米 科学 和 纳米 技术 领域 学 科 交 叉 研 

究 模式 和 程度 ,并 调查 不 同 机 构 .地 理 空间 的 研究 合 
情况 ,提出 学 科 交 叉 领域 与 经 典 学 科研 究 之 间 的 差异 
和 联系 。 基 于 作者 的 学 科 交 又 研究 虽 能 够 弥补 分 类 标 
准 的 局 限 性 ,并 且 能 够 揭示 更 多 的 学 科 交 叉 研 究 的 综 
合 认 知 和 社会 现象 ,但 是 由 于 将 作者 划分 为 某 一 学 科 
依赖 专家 判断 和 大 量 的 人 工 繁琐 工作 ,只 适用 于 小 样 
本 测度 研究 ,大 大 降低 了 指标 的 实用 性 。 
基于 引文 分 析 测 度 学 科 交 又 的 多 样 性 是 最 常用 的 学 
科 交 又 测度 方法 ,其 认为 一 篇 文章 的 引文 所 属 的 不 同 
学 科 类 别 数 可 以 表示 该 文章 的 学 科 有 交叉 程度 ,而 文章 
引文 所 属 的 学 科 可 以 通过 刊载 该 文章 期 刊 的 学 科 类 别 
表示 。D.E. Chubin 等 "通过 引文 类 别 分 析 区 分 学 科 


聚 岂 的 方法 进行 学 科 交 又 研究 ,维度 越 多 ,算法 复杂 度 
越 侍 ,很 难 适用 于 较 大 规模 数据 的 学 科 交 叉 研究 ,同时 
Vp URSI RR SCR 

它 基于 文献 自身 的 学 科 交 又 研究 以 共 类 分 析 为 基 
础 3 根据 已 有 的 分 类 标准 (杜威 十 进 制 分 类 、Web of 
Science 学 科 类 别 等 ) 将 文献 或 期 刊 划分 到 相应 的 类 别 
中 。 通 过 统计 分 析 文 献 或 期 刊 所 属 的 不 同学 科 类 别 来 
反应 这 些 论文 或 期 刊 的 学 科 交 又 特性 。 如 吴 蓄 等 "以 
Web of Science 中 文献 的 学 科 分 类 作为 判断 学 科 交 叉 
文献 的 依据 ,选取 学 科 分 类 为 农学 与 遗传 学 文献 作为 
学 科 交 又 文献 进行 主题 发 现 与 演化 分 析 。A. Allan 
等 中 基于 研究 者 的 研究 输出 (书籍 ,期 刊 .研究 报告 
等 ) 的 杜威 十 进 制 分 类 来 判定 中 西部 州立 大 学 研究 活 
动 的 学 科 交 叉 程度。R. J. W. Tijssen'” 基于 共 类 分 析 
探讨 能 源 领域 学 科 交 叉 水 平 以 及 领域 间 学 科 交 叉 联系 
强 弱 ,并 进行 可 视 化 展示 。 基 于 文献 自身 的 学 科 交 叉 


交叉 研究 文献 与 传统 单一 学 科研 究 文献 ,并 且 探讨 学 
科 交 叉 研 究 的 特征 ,构建 敏感 的 学 科 交 叉 测 度 指标 。 
A. L. Porter 等 '” 选择 《期 刊 引证 报告 ) 中 19 个 期 刊 的 
383 篇 文献 进行 研究 ,提出 外 类 别 引 用 法 这 一 新 的 指 
标 对 人 口 统计 学 .运筹 学 /管理 学 和 毒 理 学 三 个 学 科 类 
别 进行 学 科 交叉 测度 ,发 现 引文 涵盖 广泛 学 科 领 域 的 
文献 是 极其 少见 的 。J. M. Choi 等 5 对 过 去 20 年 内 美 
国 天 文学 领域 核心 期 刊 中 的 文献 进行 引文 分 析 , 探讨 
学 科 内 部 以 及 学 科 交叉 交流 模式 。 魏 海燕 等 号 统计 
情报 学 领域 文章 及 其 引文 的 学 科 分 布 ,采用 学 科 影 响 
度 指标 ,研究 与 情报 学 研究 相关 的 学 科 及 其 随时 间 的 
变化 。 研 究 人 员 通 常会 以 引用 参考 文献 的 形式 说 明 其 
研究 受 何 种 学 科 知识 的 启发 ,基于 引文 进行 文献 学 科 
交叉 测度 能 够 从 根本 上 识别 学 科 交叉 文献 ,更 好 的 把 
握 学 科 交 叉 发 展 历程 。 

目前 有 关 学 科 交 又 的 实证 研究 或 探讨 文献 或 期 刊 


研究 测度 方法 较为 简单 ,适合 较 大 范围 ,多 领域 的 学 科 
交叉 测度 。 但 是 由 于 数据 库 管 理 的 时 小 性 ,不 能 用 于 
最 近 的 研究 。 此 外 , 共 类 分 析 基 于 已 有 的 分 类 标准 将 


层面 的 学 科 交 又 特性 ,或 研究 机 构 层面 的 跨 学 科 合作 
情况 ,而 对 于 某 一 领域 或 学 科 层 面 的 学 科 交 叉 研究 , 相 
关 研 究 仅 有 从 宏观 上 把 握 领域 或 学 科 与 其 他 学 科 的 交 


文献 划分 为 不 同 的 学 科 , 对 于 学 科 边 界 较 为 明显 的 领 
域 ,其 研究 结果 较 好 ,而 对 于 学 科 边 界 比较 模糊 的 文 
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又 情况 ”或 者 对 某 两 个 领域 或 学 科 进行 学 科 交叉 的 
主题 识别 ” ,而 尚未 有 某 领域 相关 的 所 有 学 科 交 又 主 


HER, 刘 小 平 ， 徐 涵 . 基 于 Rao-Stirling 指数 的 学 科 交 叉 文 献 发 现 
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题 的 识别 研究 。 

研究 某 领域 学 科 交 义 的 主题 ,把 握 某 领域 相关 的 
学 科 交叉 点 ,首先 需要 确定 该 领域 的 学 科 交 叉 文献 。 
相关 研究 如 郭 风 娇 等 “ 利用 情报 学 和 计算 机 科学 领 


第 二 代 生 物 多 样 性 测度 指标 又 被 称 为 分 布 和 相似 
性 敏感 的 测度 指标 ,其 认为 如 果 一 篇 文献 参考 文献 所 
属 学 科 类 别 密切 相关 ,那么 该 文献 的 学 科 交 叉 程 度 较 
低 ; 而 如 果 一 篇 文献 的 参考 文献 所 属 学 科 类 别 非常 不 


域内 核心 期 刊 刊载 论文 中 的 关键 词 构造 向 量 空间 模 
型 ,通过 模糊 C 均值 算法 (FCM 算法 ) ,发 现 情报 学 和 
计算 机 科学 领域 的 学 科 交 又 文献 。 而 该 方法 仅 能 识别 
某 两 学 科 间 的 学 科 交 叉 文 献 ,而 无 法 识别 出 与 某 领域 
相关 的 所 有 学 科 交 叉 文 献 。 如 何 从 海量 文献 中 发 现 某 
领域 的 全 部 学 科 交 叉 文 献 ,并 筛选 学 科 交 义 程 度 较 高 
的 文献 作为 进一步 学 科 交 叉 主 题 识 别 的 研究 对 象 为 研 
究 的 关键 点 。 


一 本 研究 基于 引文 分 析 进 行 某 领 域 学 科 交叉 的 文献 
发 况 研 究 。 基 于 引文 分 析 测 度 研究 领域 学 科 交 叉 多 样 
性 欧 研究 所 使 用 的 测度 指标 通常 来 自 其 他 研究 领域 ， 
特 列 是 生态 学 中 的 生物 多 样 性 测度 ,主要 的 测度 方法 
URI 所 示 。 目 前 所 使 用 的 指标 大 多 为 第 一 代 生 物 多 
PERRIER Gini -Simpson 指数 和 香农 粹 "以 及 第 二 
代 毕 物 多 样 性 测度 指标 Rao-Stirling 指数 。 

ORI 基于 引文 分 析 的 交叉 学 科研 究 的 常用 指标 


ETT 定义 或 描述 
E 文章 引用 的 不 同学 科 的 数量 
>€ 着 量化 参考 文献 的 学 科 类 别 多 样 性 程度 


GifkSimpson 指数 ”测度 参考 文献 是 怎样 分 布 (或 者 集中 ) 在 学 科 类 别 中 的 
Ro=Stirling 指数 “可 被 理解 为 考虑 距离 /相似 度 (学 科 间 ) 的 Simpson 多 样 性 


-CO 第 一 代 生物 多 样 性 测度 指标 又 被 称 为 分 布 敏 感性 
测度 指标 。 最 简单 的 测度 指标 为 多 样 性 , 即 测度 文章 
应 用 不 同学 科 的 数量 ,认为 一 篇 具有 参考 文献 所 属 两 
个 以 上 学 科 类 别 的 文献 比 参考 文献 仅 属于 一 个 学 科 类 
别 的 文献 更 具有 多 样 性 ,也 就 是 学 科 交 叉 程度 越 高 ,这 
个 方法 的 一 个 明显 的 局 限 性 是 它 忽略 了 引文 所 属 学 科 
类 别 之 间 的 分 布 情况 。 第 一 代 多 样 性 测量 方法 已 被 发 
展 为 考虑 文献 所 属 不 同类 别 参考 文献 的 数量 ,两 个 主 
EUER OU MÄI Gini -Simpson 指数 ,分 别 测度 文献 参 
考 文献 所 属 学 科 类 别 的 不 确定 性 和 属于 不 同学 科 类 别 
的 概率 。 虽 然 第 一 代 生 物 多 样 性 测度 指标 考虑 参考 文 
献 的 学 科 分 布 ,但 是 由 于 其 基于 所 有 学 科 类 别 是 完全 
不 同 的 这 一 假设 而 被 批判 。 其 认为 不 管 文献 参考 文献 
所 属 学 科 类 别 之 间 的 相似 性 如 何 ,如 果 两 篇 文献 的 参 
考 文献 有 着 相同 数量 的 学 科 类 别 , 那 么 这 两 篇 文献 的 
学 科 交 又 程度 相同 。 


同 ,那么 该 文献 为 高 度 学 科 交 叉 文 献 。 主 要 测度 指标 
为 Andy Stirling 提出 的 Rao -Stirling 指数 ,考虑 学 科 间 
的 相似 性 和 相 异 性 。 相 关公 式 如 下 : 

Variety =v = 文章 参考 文献 所 属 的 WOS 学 科 类 
别 数 
Disparity = 


1 E: 
s -1) >s 


l & 
Balance — In(v) ^P/InP; 


Rao-Stirling Diversity = Y p.p 

其 中 ,vs 为 数据 集中 文献 参考 文献 所 属 学 科 类 别 
最 多 的 个 数 ,p; 为 第 i 学 科 类 别 在 参考 文献 中 所 占 比 
例 ,d; 为 学 科 类 别 i 和 学 科 类 别 j 之 间 的 距离 。Variety 
(种 类 ) 表 示 文 献 的 参考 文献 可 以 被 归 类 到 学 科 类 别 
的 数量 ,学 科 类 别 数量 越 多 , 则 该 文献 的 学 科 交 又 性 越 
强 ;Balance( 平 衡 ) 描述 参考 文献 的 学 科 分 布 的 均衡 
JE ,在 这 里 使 用 Shannon 均匀 度 表 示 ,如果 一 篇 文献 中 
每 个 类 别 中 参考 文献 个 数 是 相同 的 ,说 明 该 文献 的 参 
考 文献 的 学 科 分 布 是 均衡 的 ,学 科 分 布 越 均 衡 ,文献 的 
学 科 交 又 性 越 强 ;Disparity( 差异 ) 表示 元 素 分 布 的 特 
异性 程度 ,说 明文 献 引用 不 同学 科 分 类 的 引文 的 差异 
程度 (距离 ) ,如 果 一 篇 文献 参考 文献 所 属 学 科 类 别 的 
相似 度 较 大 (例如 物理 化 学 和 应 用 物理 ) ,那么 该 文献 
的 差异 度 ( Disparity ) 就 较 小 ,文献 学 科 交 又 程度 就 越 
小 ,如 果 相 似 度 较 小 (例如 动物 学 和 应 用 物理 ) ,该 文 
献 的 差异 度 较 大 ,文献 学 科 交 叉 程度 就 越 大 。 前 三 个 
公式 分 别 代表 学 科 多 样 性 的 三 个 不 同方 面 , Rao - 
Stirling 指数 整合 三 个 学 科 交 又 度量 层面 ,将 多 样 性 的 
种 类 (Variety) 平衡 (Balance) 和 差异 ( Disparity ) 这 三 
个 维度 结合 在 一 起 。 

本 研究 拟 以 纳米 科学 与 纳米 技术 领域 为 例 , 基 于 
Rao-Stirling 指数 计算 该 领域 文献 引文 所 属 期 刊 的 学 科 
分 布 来 测度 文献 的 学 科 交 又 程度 ,从 而 探讨 纳米 科学 
与 纳米 技术 领域 文献 的 学 科 交 叉 情 况 并 发 现 该 领域 的 
学 科 交 叉 文献 。 


4 数据 来 源 与 处 理 


4.1 样本 数据 来 源 
本 文选 择 汤 森 路 透 Web of Science ( WoS) 的 SCI- 
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EXPANDED 数据 库 中 有 关 纳 米 科 学 与 纳米 技术 的 文 
献 作 为 研究 对 象 ,检索 式 为 WC = (“Nanoscience & 
Nanotechnology”) ,并 限定 文献 类 型 为 ARTICLE , PRO- 
CEEDINGS PAPER 和 REVIEW ,出 版 年 为 2016 年 , 检 
索 日 期 为 2017 年 3 月 31 H ,检索 结果 为 40 618 。 利 用 
L. Leydesdorff 开发 的 WoS 文献 题 录 信息 处 理 程序 ISI. 
exe 提取 下 载 文献 的 题 录 信 息 , 并 生成 关系 数据 库 ” 。 
4.2 构建 期 刊 缩写 — 全 称 -学科 类 别 对 照 表 

对 下 载 的 纳米 领域 与 纳米 技术 领域 的 文献 的 引文 
进行 整理 ,得 到 WoS 纳米 科学 与 纳米 技术 领域 文献 引 
文 信息 ( 见 表 2) ,其 中 ID 表示 文献 的 编号 。 由 于 下 载 
的 引文 信息 仅 有 引文 所 属 的 期 刊 ,没有 期 刊 所 属 的 学 
科 类 别 ,所 以 需 构 建 期 刊 - 学 科 类 别 对 照 表 。WoS fi 
-5 革 于 期 刊 标题 及 其 引用 图 谱 一 系列 指标 为 Wos 数 
据 府中 所 收录 的 每 个 期 刊 分 配 其 对 应 的 学 科 类 别 
(Web of Science Category, WC) , WoS 的 《期 刊 引 用 报 
AX Journal Citation Reports, JCR ) 网 站 上 提供 了 每 个 


期 刊 所 属 的 学 科 类 别 信息 ”。 利 用 Python 下 载 JCR 
所 提供 的 期 刊 以 及 其 所 属 的 学 科 类 别 信 息 构 建 期 刊 - 
学 科 类 别 对 照 表 。 由 于 从 JCR 中 期 刊 信息 使 用 的 是 期 
刊 的 全 名 表示 ,而 从 WoS 中 下 载 的 纳米 科学 与 纳米 技 
术 领 域 文献 的 题 录 信 息 中 参考 文献 所 属 期 刊 使 用 该 期 
刊 的 缩写 名 称 表示 ,所 以 还 需 构 建 期 刊 全 名 - 缩写 名 
对 照 表 。ESI Journal List 是 基本 科学 指标 数据 库 ( Es- 
sential Science Indicators, ESI) 发布 的 包含 WoS 数据 库 
中 期 刊 和 期 刊 缩写 信息 的 列表 ” 。 将 从 JCR 数据 库 
中 获得 的 期 刊 全 称 - 学 科 类 别 对 照 表 与 ESI Journal 
List 的 期 刊 全 称 — 缩写 对 照 表 进行 关联 ,得 到 构建 期 
刊 全 称 - 期 刊 缩写 - 所 属 学 科 类 别 对 照 表 ,其 中 包含 
WoS 收录 的 11 375 个 期 刊 ,最 终 得 到 17 961 个 期 刊 - 
学 科 类 别 映 射 结果 , 即 平均 一 个 期 刊 对 应 1. 58 个 学 科 
类 别 。 期 刊 缩写 - 全 称 - 所 属 学 科 类 别 对 照 表 如 表 3 
所 示 。 


表 2 WoS 纳米 科学 与 纳米 技术 领域 文献 引文 信息 (部分) 


参考 文献 saxna DOS 期 和 por 
Alonso MI, 2005, J APPL PHYS, V98 M.I. Alonso 2005 J APPL PHYS DOI 10. 1063/1. 2006229 
Barry SD, 2011, CHEM MATER, V23, P5096 S. D. Bany 2011 CHEM MATER DOI 10. 1021/cm202761k 
: Benchamekh R, 2014, PHYS REV B, V89 R. Benchamekh 2014 PHYS REV B DOI 10. 1103/PhysRevB. 89. 035307 
r ^ Bostedt C, 2004, APPL PHYS LETT, V84, P4056 C. Bostedt 2004 APPL PHYS LETT DOI 10. 1063/1. 1751616 
; si Boykin BT, 2005, PHYS REV B, V71 B. T. Boykin 2005 PHYS REV B 
Boykin TB, 2007, J PHYS-CONDENS MAT, V19 T. B. Boykin 2007 J PHYS-CONDENS MAT DOI 10. 1088/0953 —8984/19/3/036203 
Bricogne G, 2006, INT TABLES CRYSTALLO, VB G. Bricogne 2006 INT TABLES CRYSTALLO 
Buljan M, 2010, PHYS REV B, V82 M. Buljan 2010 PHYS REV B DOI 10. 1103/PhysRevB. 82. 235407 
Bulutay C, 2007, PHYS REV B, V76 C. Bulutay 2007 PHYS REV B DOI 10. 1103/PhysRevB. 76. 205321 
40491 Zhou Y, 2009, ADV FUNCT MATER, V19, P3293 Y. Zhou 2009 ADV FUNCT MATER DOI 10. 1002/adfm. 200900702 


RI 期刊 全 称 -缩写 -学 科 类 别 对 照 表 ( 部 分 ) 


期 刊 缩写 期 刊 全 称 学 科 类 别 
2D MATER 2D Materials MATERIALS SCIENCE, MULTIDISCIPLINARY 


3 BIOTECH 3 Biotech 
40R-Q J OPER RES 

AAPG BULL AAPG BULLETIN 
AAPS J AAPS Journal 


AAPS PHARMSCITECH AAPS PHARMSCITECH 


AATCC J RES AATCC Journal of Research 
AATCC REV AATCC REVIEW 
AATCC REV AATCC REVIEW 
AATCC REV AATCC REVIEW 


4.3 参考 文献 的 学 科 映 射 
对 下 载 的 文献 题 录 信息 进行 数据 清洗 ,删除 摘要 、 
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40R-A Quarterly Journal of Operations Research 


BIOTECHNOLOGY & APPLIED MICROBIOLOCY 
OPERATIONS RESEARCH & MANAGEMENT SCIENCE 
GEOSCIENCES, MULTIDISCIPLINAR Y 
PHARMACOLOGY & PHARMACY 
PHARMACOLOGY & PHARMACY 
MATERIALS SCIENCE, TEXTILES 
CHEMISTRY, APPLIED 
ENGINEERING, CHEMICAL 
MATERIALS SCIENCE, TEXTILES 


关键 词 参考 文献 等 信息 不 全 的 文献 ,最 终 得 到 40 491 
篇 文献 共 1 649 353 条 参考 文献 记录 ,平均 一 篇 文献 引 


韩正 琪 , 刘 小 平 ， 徐 涵 . 基于 Rao-Stirling 指数 的 学 科 交 叉 文 献 发 现 


2018 ,62(1) :125 — 131. 


期 刊 
XXE. 


"UTTETETUTESI 2452 51 


用 40.73 篇 参考 文献 。 基 于 MySQL 数据 库 软 件 ,利用 
期 刊 缩 写 - 全 称 - 所 属 学 科 类 别 对 照 表 ,将 所 下 载 的 
每 篇 文献 的 参考 文献 根据 其 所 属 期 刊 映 射 至 一 个 或 多 
个 WoS 学 科 类 别 中 。 最 终 将 1 461 341 条 参考 文献 记 
录 映 射 至 相应 学 科 类 别 , 成 功 匹 配 的 参考 文献 占 总 参 
考 文献 的 88. 60% ,平均 一 篇 参考 文献 所 属 期 刊 对 应 


2.24 个 学 科 类 别 。 


5 ”纳米 科学 与 纳米 技术 领域 学 科 交 又 


文献 发 现 
5.1 构建 文献 参考 文献 的 学 科 类 别 和 矩阵 

利用 Python 编程 ,将 文献 参考 文献 所 属 学 科 类 别 
转换 为 矩阵 的 形式 表示 ( 见 表 4) ,其 中 ,每 一 行 代 表 一 


篇 文献 的 参考 文献 的 学 科 分 布 ,每 一 列表 示 每 篇 文献 


程度 测度 结果 更 加 可 信 , 需 剔除 参考 文献 所 属 学 科 类 
别 总 数 小 于 3 的 参考 文献 ”。 最 终 得 到 38 598 篇 待 
测度 的 纳米 科学 与 纳米 技术 领域 的 文献 参考 文献 的 学 
科 类 别 矩 阵 , 占 所 下 载 文献 总 数 的 95.32% 。 
5.2 ”纳米 科学 与 纳米 科技 领域 的 学 科 交叉 文献 发 现 
在 Rao-Stirling 公式 中 ,di 为 学 科 类 别 i 和 学 科 类 
别 j 之 间 的 距离 。 为 保证 研究 结果 的 可 靠 性 和 可 对 比 
性 ,本 研究 采用 基于 D. Chavarro 等 .所 提供 的 Wos 学 
科 类 别 相似 矩阵 , 即 按照 L Rafols 等 ”提出 的 方法 , 基 
于 2007 年 JCR 光盘 版 中 收录 的 60 947 519 篇 文献 , 构 
建 其 所 属 学 科 类 别 的 共 被 引 和 矩阵 ,计算 学 科 类 别 间 的 
余弦 相似 度 , 最 终 得 到 学 科 相 似 度 和 矩阵。 基于 该 相似 
度 和 矩阵 编写 R 程序 ,分 别 测度 每 篇 文献 的 种 类 ( Varie- 
ty) .均衡 度 (Balance) .差异 性 (Disparity ) 以 及 Rao - 


属 手 该 学 科 类 别 参考 文献 数目 。 为 了 使 文献 学 科 交叉 “Stirling 多 样 性 指数 。 
Co A4 文献 参考 文献 学 科 类 别 和 矩阵 ( 8827 ) 

TEPORE 应 BERE 纳米 科学 与 OL. IB.  WAJET. — 1. EF 
物理 物理 纳米 技术 。 化 学 "5 maar 分 和 化 学 000077 动物 学 

1 24 20 12 10 4 2 2 0 | r4 0 

2 19 16 25 22 3 1 4 0 | "e 0 

3 4 3 6 17 0 0 3 0 / »- 6 0 

4 6 11 6 14 0 1 3 0 |  --- 0 

3 Jt 12 2 3 1 0 1 0 6e 0 

m 6 6 15 12 17 0 0 4 0 | "e 0 

gi 6 7 8 12 2 0 5 0 | 0 

8 32 14 19 18 4 0 1 0 | --- 0 

9 8 4 9 9 0 0 0 0 see 0 

» 10 7 0 7 6 0 { 0 0 eee 0 


COR 5 所 表示 的 是 按照 文献 Rao-Stiring 指数 从 大 到 
少 葛 部 分 测度 结果 ,Rao -Stiling 指数 越 大 , 则 该 文献 学 
科 突 又 程度 越 高 。 图 ! 为 纳米 科学 与 纳米 技术 领域 广 
献 Rao-Striling 指数 的 频率 分 布 直方 图 。 可 以 发 现 , 纳 
米 科学 与 纳米 技术 领域 文献 的 Rao-Stinling 指数 大 多 
集中 于 0.2 -0.5 之 间 。 结 合 直方 图 并 查阅 相关 文献 


可 以 将 文献 学 科 交 叉 分 为 三 个 水 平 :大 部 分 文献 的 的 
Rao-Stirling 指数 在 0.2 -0.5 之 间 , 属 于 中 度 学 科 交 又 
文献 ;大 于 0.5 的 文献 属于 高 度 学 科 交 叉 文 献 ; 小 于 
0.2 的 文献 属于 低 度 学 科 交 叉 文 献 。 可 以 根据 研究 需 
要 设 定 不 同 的 阔 值 ,筛选 领域 学 科 交 又 文 献 用 于 进 一 
步 的 学 科 交 叉 主 题 识别 。 


表 5 纳米 科学 与 纳米 技术 领域 文献 学 科 交 又 测 度 结果 
ID 标题 Rao-Stirling 种 类 ”均衡 度 差异 性 
29215 QUALITATIVE DATA ANALYSIS IN PRODUCT DEVELOPMENT - AN EXPLORATION OF CLOSED LOOP 0.81 15 0.99 0.87 
THINKING IN PRODUCT REQUIREMENTS 
8050 Settling into the midstream? Lessons for governance from the decade of nanotechnology 0. 80 19 0.96 0.85 
40128 Mean Particle Diameters. Part VIII. Computer Program to Decompose Mixtures of ( Truncated) Lognormal Parti- 0.78 25 0.92 0.84 
cle Size Distributions Using Differential Evolution to Generate Starting Values for Nonlinear Least Squares 
28877 A REVIEW ON THE NONJNVASIVE EVALUATION OF SKELETAL MUSCLE OXYGENATION 0.77 21 0.95 0.80 
13144 Study of the Airflow Patterns and of the Characteristics of Bio-Aerosol Nanoparticle Deposition in Human Upper 0.77 28 0.93 0.81 
Respiratory Tracts Based on Computed Tomography Scanning Reconstruction 
25077 Techniques and Applications of Emotion Recognition in Speech 0.77 13 0.96 0.83 
39339 Detection of airborne bacteria with disposable bio-precipitator and NanoGene assay 0. 77 26 0.93 0.79 
21306 An Electrochemical Microbubble-Based MEMS Pressure Sensor 0. 77 26 0.92 0.82 
20794 Mental Fatigue Monitoring Using a Wearable Transparent Eye Detection System 0.76 17 0.95 0.83 
40336 Stress relaxation in pulsed DC electromigration measurements 0.00 1 0.00 0.00 
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35% 


占 纳米 科学 与 纳米 技术 文献 比例 
t2 
[=] 
$3 


0-0.1 0.1-0.2 0.2-0.3 0.3-0.4 0.4-0.5 0.5-0.6 0.6-0.7 0.7-0.8 0.8-0.9 
Rao-Stirling 指数 


图 1 纳米 科学 与 技术 领域 文献 Rao-Stirling 
指数 频率 直方 图 


学 科 交 又 文献 发 现 是 进行 学 科 交 又 研究 的 重要 前 
所 3 从 海量 的 文献 中 快速 .精准 地 发 现 领域 相关 交叉 广 
绮 助 于 研究 人 员 快 速 地 把 握 领域 学 科 交 又 动态 , 识 
踢 领 互 学 科 交 又 研究 热点 与 前 沿 。 本 研究 基于 引文 分 
WEE Rao-Stirling 指数 用 于 学 科 交 叉 的 文献 发 现 研究 ， 
并 到 纳米 科学 与 纳米 技术 领域 为 例 , 验 证 方法 的 可 行 
局 另 外 ,本 研究 所 提出 的 学 科 交 叉 的 文献 发 现 方法 
BA 网 构建 的 期 刊 缩写 - 全 称 - 学 科 类 别 对 照 表 和 基于 
PS 和 上 编写 的 参考 文献 学 科 映射 和 学 科 交 叉 测度 
指 硫 的 计算 程序 同样 适用 于 其 他 领域 的 学 科 交 叉 文献 
发 现 研究 ,所 得 到 的 纳米 科学 与 纳米 技术 领域 的 高 度 
学 各 交叉 文献 也 可 用 于 后 续 的 纳米 科学 与 纳米 技术 领 
域 酌 学 科 交叉 主题 识别 研究 ,为 后 续 的 研究 商定 基础 。 
.所 本 研究 所 提出 的 基于 Rao Stirling 指数 的 学 科 交 

缺 发 现 方法 通过 测度 文献 参考 文献 的 学 科 分 布 情 
况 祖 比 前 文 所 综述 的 其 他 方法 具有 以 下 优点 :该 方 
法 可 以 发 现 与 某 领域 相关 的 所 有 学 科 交 叉 文献 ,日 算 
法 复杂 度 较 低 ,有 利于 大 数据 集 的 学 科 交 又 文 献 发 现 
研究 的 实现 。@@ 基 于 文献 引文 所 属 学 科 类 别 对 文献 的 
学 科 交叉 程度 进行 测度 ,可 以 从 源头 上 发 现 研究 者 或 
者 研究 团队 进行 某 一 研究 时 所 受到 知识 启发 都 来 自 哪 
些 其 他 学 科 ,从 而 能 够 更 好 的 把 握 学 科 交 又 的 发 展 路 
线 和 未 来 发 展 方向 。@ 该 方法 不 仅 可 以 发 现 学 科 交 叉 
文献 ,还 可 以 对 学 科 交 叉 文献 的 学 科 交 叉 程 度 进行 定 
量 的 测度 ,从 而 筛选 得 到 高 度 学 科 交 叉 文献 。 一 方面 ， 
目前 研究 发 现 高 度 学 科 交 叉 文献 通常 伴随 着 高 被 引 
量 ,也 就 是 说 高 度 的 学 科 交 叉 文 献 通常 代表 着 该 领域 
当前 研究 热点 和 前 沿 29 ; 另 一 方面 ,由 于 目前 文献 或 
多 或 少 都 具有 学 科 交 又 特性 , 仅 筛选 出 某 领域 高 度 学 
科 交 又 文 献 作为 后 续 领 域 学 科 交 又 主题 识别 研究 对 象 
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可 以 减少 数据 量 ,降低 算法 复杂 度 。 

本 研究 所 提出 的 基于 Rao -Stirling 指数 的 学 科 交 
又 文献 发 现 方法 在 整个 研究 过 程 中 仍然 存在 一 些 问题 
有 等 进一步 解决 :一 是 本 研究 基于 WoS 的 学 科 类 别 来 
判断 文献 参考 文献 所 属 学 科 , 不 同 的 学 科 分 类 体系 测 
度 文献 学 科 交 叉 程 度 得 到 的 结果 也 不 完全 相同 ;二 是 
本 研究 所 提出 的 基于 引文 分 析 的 领域 学 科 交 叉 文献 发 
现 是 否 能 够 准确 的 从 认识 论 或 者 认 知 意义 上 识别 学 科 
交叉 文献 还 有 待 于 进一步 验证 ;三 是 学 科 交叉 文献 阔 
值 的 确定 ,尚未 有 标准 的 国 值 的 划 定 某 一 文献 是 否 为 
学 科 交 叉 文 献 或 者 高 度 学 科 交 叉 文 献 , 虽 然 通 过 抽取 
Rao-Stirling 指数 大 于 等 于 0.5 的 文献 进行 通读 后 发 现 
其 具有 较 高 的 学 科 交 叉 性 ,但 相关 结果 须要 领域 专家 
结合 领域 相关 知识 进行 进一步 验证 。 

综 上 ,在 未 来 研究 中 ,计划 进行 基于 多 种 学 科 分 类 
体系 的 学 科 交 叉 测 度 对 比 研究 ,并 将 纳米 科学 与 纳米 
技术 领域 学 科 交 叉 文献 发 现 结果 经 专家 判读 后 用 于 后 
续 领域 学 科 交 又 的 主题 识别 研究 ,以 期 发 现 纳米 科学 
与 纳米 技术 领域 的 学 科 交 叉 点 。 此 外 , 拟 开展 其 他 学 
科 的 学 科 交 叉 文 献 发 现 研 究 。 
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bstract. [ Purpose/ significance | Discovering the interdisciplinary literature is an important prerequisite for inter- 
disciplinary research. Finding domain-related interdisciplinary publications from vast amounts of literature quickly and ac- 
curately will help researchers understand the new tendency of interdisciplinarity and identify the focal and hot themes of 
the field rapidly. This paper presents a novel approach to discover the interdisciplinary literature based on Rao-Stirling di- 
versity indices. Focusing on the case study in the field of nanoscience & nanotechnology, we discussed the feasibility of 
the method. | Method/process ] Based on the nanoscience and nanotechnology publications in the Web of Science, we 
mapped references to the Web of Science Category , constructed the subject distribution matrix and calculated the interdis- 
ciplinary measure indices of the documents based on Python and R to find the interdisciplinary literature. [ Result/conclu- 
sion | The paper shows that the interdisciplinary literature discovery method based on Rao-Stirling diversity indices can 
measure the degree of interdisciplinarity in the publication level and discover the interdisciplinary publications in the field 
of nanoscience and nanotechnology. The method could be applied to other research fields. 
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